[Obsoleto] Conclusões de chat para uso do SDK/client da OpenAI

curl --request POST \
  --url https://apigw.mka1.com/api/v1/llm/chat/completions \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '
{
  "model": "meetkai:functionary-urdu-mini-pak",
  "messages": [
    {
      "role": "user",
      "content": "What is the capital of France?"
    }
  ],
  "temperature": 0.7,
  "max_tokens": 100
}
'

import requests

url = "https://apigw.mka1.com/api/v1/llm/chat/completions"

payload = {
    "model": "meetkai:functionary-urdu-mini-pak",
    "messages": [
        {
            "role": "user",
            "content": "What is the capital of France?"
        }
    ],
    "temperature": 0.7,
    "max_tokens": 100
}
headers = {
    "Authorization": "Bearer <token>",
    "Content-Type": "application/json"
}

response = requests.post(url, json=payload, headers=headers)

print(response.text)

const options = {
  method: 'POST',
  headers: {Authorization: 'Bearer <token>', 'Content-Type': 'application/json'},
  body: JSON.stringify({
    model: 'meetkai:functionary-urdu-mini-pak',
    messages: [{role: 'user', content: 'What is the capital of France?'}],
    temperature: 0.7,
    max_tokens: 100
  })
};

fetch('https://apigw.mka1.com/api/v1/llm/chat/completions', options)
  .then(res => res.json())
  .then(res => console.log(res))
  .catch(err => console.error(err));

<?php

$curl = curl_init();

curl_setopt_array($curl, [
  CURLOPT_URL => "https://apigw.mka1.com/api/v1/llm/chat/completions",
  CURLOPT_RETURNTRANSFER => true,
  CURLOPT_ENCODING => "",
  CURLOPT_MAXREDIRS => 10,
  CURLOPT_TIMEOUT => 30,
  CURLOPT_HTTP_VERSION => CURL_HTTP_VERSION_1_1,
  CURLOPT_CUSTOMREQUEST => "POST",
  CURLOPT_POSTFIELDS => json_encode([
    'model' => 'meetkai:functionary-urdu-mini-pak',
    'messages' => [
        [
                'role' => 'user',
                'content' => 'What is the capital of France?'
        ]
    ],
    'temperature' => 0.7,
    'max_tokens' => 100
  ]),
  CURLOPT_HTTPHEADER => [
    "Authorization: Bearer <token>",
    "Content-Type: application/json"
  ],
]);

$response = curl_exec($curl);
$err = curl_error($curl);

curl_close($curl);

if ($err) {
  echo "cURL Error #:" . $err;
} else {
  echo $response;
}

package main

import (
	"fmt"
	"strings"
	"net/http"
	"io"
)

func main() {

	url := "https://apigw.mka1.com/api/v1/llm/chat/completions"

	payload := strings.NewReader("{\n  \"model\": \"meetkai:functionary-urdu-mini-pak\",\n  \"messages\": [\n    {\n      \"role\": \"user\",\n      \"content\": \"What is the capital of France?\"\n    }\n  ],\n  \"temperature\": 0.7,\n  \"max_tokens\": 100\n}")

	req, _ := http.NewRequest("POST", url, payload)

	req.Header.Add("Authorization", "Bearer <token>")
	req.Header.Add("Content-Type", "application/json")

	res, _ := http.DefaultClient.Do(req)

	defer res.Body.Close()
	body, _ := io.ReadAll(res.Body)

	fmt.Println(string(body))

}

HttpResponse<String> response = Unirest.post("https://apigw.mka1.com/api/v1/llm/chat/completions")
  .header("Authorization", "Bearer <token>")
  .header("Content-Type", "application/json")
  .body("{\n  \"model\": \"meetkai:functionary-urdu-mini-pak\",\n  \"messages\": [\n    {\n      \"role\": \"user\",\n      \"content\": \"What is the capital of France?\"\n    }\n  ],\n  \"temperature\": 0.7,\n  \"max_tokens\": 100\n}")
  .asString();

require 'uri'
require 'net/http'

url = URI("https://apigw.mka1.com/api/v1/llm/chat/completions")

http = Net::HTTP.new(url.host, url.port)
http.use_ssl = true

request = Net::HTTP::Post.new(url)
request["Authorization"] = 'Bearer <token>'
request["Content-Type"] = 'application/json'
request.body = "{\n  \"model\": \"meetkai:functionary-urdu-mini-pak\",\n  \"messages\": [\n    {\n      \"role\": \"user\",\n      \"content\": \"What is the capital of France?\"\n    }\n  ],\n  \"temperature\": 0.7,\n  \"max_tokens\": 100\n}"

response = http.request(request)
puts response.read_body

{
  "id": "chatcmpl-abc123",
  "object": "chat.completion",
  "created": 1704067200,
  "model": "meetkai:functionary-urdu-mini-pak",
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "The capital of France is Paris."
      },
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 15,
    "completion_tokens": 8,
    "total_tokens": 23
  }
}

Chat Completions

[Obsoleto] Conclusões de chat para uso do SDK/client da OpenAI

deprecated

Deprecado: Use a API de Respostas (/api/v1/llm/responses) em vez disso. Endpoint de conclusão de chat compatível com OpenAI, projetado para uso com as bibliotecas cliente oficiais da OpenAI (Python, Node.js, etc.). Suporta tanto solicitações em streaming quanto não em streaming configurando o parâmetro stream. Este endpoint lida com a solicitação/resposta diretamente e retorna respostas no formato padrão da OpenAI. Use isso ao integrar com o código cliente existente da OpenAI. Observação: O manipulador real é registrado no nível do servidor Bun para desempenho ideal com o formato de streaming do SDK da OpenAI.

POST

api

llm

chat

completions

[Obsoleto] Conclusões de chat para uso do SDK/client da OpenAI

curl --request POST \
  --url https://apigw.mka1.com/api/v1/llm/chat/completions \
  --header 'Authorization: Bearer <token>' \
  --header 'Content-Type: application/json' \
  --data '
{
  "model": "meetkai:functionary-urdu-mini-pak",
  "messages": [
    {
      "role": "user",
      "content": "What is the capital of France?"
    }
  ],
  "temperature": 0.7,
  "max_tokens": 100
}
'

import requests

url = "https://apigw.mka1.com/api/v1/llm/chat/completions"

payload = {
    "model": "meetkai:functionary-urdu-mini-pak",
    "messages": [
        {
            "role": "user",
            "content": "What is the capital of France?"
        }
    ],
    "temperature": 0.7,
    "max_tokens": 100
}
headers = {
    "Authorization": "Bearer <token>",
    "Content-Type": "application/json"
}

response = requests.post(url, json=payload, headers=headers)

print(response.text)

const options = {
  method: 'POST',
  headers: {Authorization: 'Bearer <token>', 'Content-Type': 'application/json'},
  body: JSON.stringify({
    model: 'meetkai:functionary-urdu-mini-pak',
    messages: [{role: 'user', content: 'What is the capital of France?'}],
    temperature: 0.7,
    max_tokens: 100
  })
};

fetch('https://apigw.mka1.com/api/v1/llm/chat/completions', options)
  .then(res => res.json())
  .then(res => console.log(res))
  .catch(err => console.error(err));

<?php

$curl = curl_init();

curl_setopt_array($curl, [
  CURLOPT_URL => "https://apigw.mka1.com/api/v1/llm/chat/completions",
  CURLOPT_RETURNTRANSFER => true,
  CURLOPT_ENCODING => "",
  CURLOPT_MAXREDIRS => 10,
  CURLOPT_TIMEOUT => 30,
  CURLOPT_HTTP_VERSION => CURL_HTTP_VERSION_1_1,
  CURLOPT_CUSTOMREQUEST => "POST",
  CURLOPT_POSTFIELDS => json_encode([
    'model' => 'meetkai:functionary-urdu-mini-pak',
    'messages' => [
        [
                'role' => 'user',
                'content' => 'What is the capital of France?'
        ]
    ],
    'temperature' => 0.7,
    'max_tokens' => 100
  ]),
  CURLOPT_HTTPHEADER => [
    "Authorization: Bearer <token>",
    "Content-Type: application/json"
  ],
]);

$response = curl_exec($curl);
$err = curl_error($curl);

curl_close($curl);

if ($err) {
  echo "cURL Error #:" . $err;
} else {
  echo $response;
}

package main

import (
	"fmt"
	"strings"
	"net/http"
	"io"
)

func main() {

	url := "https://apigw.mka1.com/api/v1/llm/chat/completions"

	payload := strings.NewReader("{\n  \"model\": \"meetkai:functionary-urdu-mini-pak\",\n  \"messages\": [\n    {\n      \"role\": \"user\",\n      \"content\": \"What is the capital of France?\"\n    }\n  ],\n  \"temperature\": 0.7,\n  \"max_tokens\": 100\n}")

	req, _ := http.NewRequest("POST", url, payload)

	req.Header.Add("Authorization", "Bearer <token>")
	req.Header.Add("Content-Type", "application/json")

	res, _ := http.DefaultClient.Do(req)

	defer res.Body.Close()
	body, _ := io.ReadAll(res.Body)

	fmt.Println(string(body))

}

HttpResponse<String> response = Unirest.post("https://apigw.mka1.com/api/v1/llm/chat/completions")
  .header("Authorization", "Bearer <token>")
  .header("Content-Type", "application/json")
  .body("{\n  \"model\": \"meetkai:functionary-urdu-mini-pak\",\n  \"messages\": [\n    {\n      \"role\": \"user\",\n      \"content\": \"What is the capital of France?\"\n    }\n  ],\n  \"temperature\": 0.7,\n  \"max_tokens\": 100\n}")
  .asString();

require 'uri'
require 'net/http'

url = URI("https://apigw.mka1.com/api/v1/llm/chat/completions")

http = Net::HTTP.new(url.host, url.port)
http.use_ssl = true

request = Net::HTTP::Post.new(url)
request["Authorization"] = 'Bearer <token>'
request["Content-Type"] = 'application/json'
request.body = "{\n  \"model\": \"meetkai:functionary-urdu-mini-pak\",\n  \"messages\": [\n    {\n      \"role\": \"user\",\n      \"content\": \"What is the capital of France?\"\n    }\n  ],\n  \"temperature\": 0.7,\n  \"max_tokens\": 100\n}"

response = http.request(request)
puts response.read_body

{
  "id": "chatcmpl-abc123",
  "object": "chat.completion",
  "created": 1704067200,
  "model": "meetkai:functionary-urdu-mini-pak",
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "The capital of France is Paris."
      },
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 15,
    "completion_tokens": 8,
    "total_tokens": 23
  }
}

Autorizações

Authorization

string

header

obrigatório

Gateway auth: send Authorization: Bearer <mka1-api-key>. For multi-user server-side integrations, you can also send X-On-Behalf-Of: <external-user-id>.

Cabeçalhos

X-On-Behalf-Of

string

Optional external end-user identifier forwarded by the API gateway.

Corpo

application/json

Parâmetros de solicitação para criar uma conclusão de chat. Baseado na API de Conclusões de Chat da OpenAI.

model

string

obrigatório

ID do modelo a ser utilizado. Você pode usar o formato provider:model ou apenas o nome do modelo com um provedor padrão.

Minimum string length: 1

messages

object[]

obrigatório

Uma lista de mensagens que compreende a conversa até agora. Pelo menos uma mensagem é necessária.

Minimum array length: 1

Show child attributes

tools

object[]

Uma lista de ferramentas que o modelo pode chamar. Use isso para fornecer definições de funções que o modelo pode invocar.

Show child attributes

tool_choice

Controle qual (se houver) ferramenta é chamada pelo modelo. 'nenhuma' significa que o modelo não chamará nenhuma ferramenta. 'automático' significa que o modelo pode escolher. 'obrigatório' força uma chamada de ferramenta.

stream

boolean

Se definido, deltas de mensagens parciais serão enviados como eventos enviados pelo servidor. Nota: Este campo é ignorado pelo endpoint de streaming, sendo usado apenas pelos endpoints de cliente compatíveis com a OpenAI.

integer

Quantas opções de conclusão de chat gerar para cada mensagem de entrada. O padrão é 1.

Intervalo obrigatório: 1 <= x <= 9007199254740991

max_tokens

integer

O número máximo de tokens que podem ser gerados na conclusão do chat. O comprimento total dos tokens de entrada e dos tokens gerados é limitado pelo comprimento de contexto do modelo.

Intervalo obrigatório: 1 <= x <= 9007199254740991

temperature

number

Qual temperatura de amostragem usar, entre 0 e 2. Valores mais altos, como 0,8, tornarão a saída mais aleatória, enquanto valores mais baixos, como 0,2, a tornarão mais focada e determinística.

Intervalo obrigatório: 0 <= x <= 2

top_p

number

Uma alternativa à amostragem com temperatura, chamada amostragem de núcleo, onde o modelo considera os resultados dos tokens com a massa de probabilidade top_p. Assim, 0,1 significa que apenas os tokens que constituem os 10% superiores da massa de probabilidade são considerados.

Intervalo obrigatório: 0 <= x <= 1

frequency_penalty

number

Número entre -2,0 e 2,0. Valores positivos penalizam novos tokens com base em sua frequência existente no texto até agora, diminuindo a probabilidade do modelo repetir a mesma linha verbatim.

presence_penalty

number

Número entre -2,0 e 2,0. Valores positivos penalizam novos tokens com base em sua aparição no texto até agora, aumentando a probabilidade do modelo de falar sobre novos tópicos.

seed

integer

Se especificado, o sistema fará o melhor esforço para amostrar de forma determinística. O determinismo não é garantido, mas a mesma semente deve, tipicamente, retornar resultados semelhantes.

Intervalo obrigatório: -9007199254740991 <= x <= 9007199254740991

stop

Até 4 sequências nas quais a API interromperá a geração de tokens adicionais. O texto retornado não conterá a sequência de parada.

response_format

object

Um objeto que especifica o formato que o modelo deve retornar. Definir como { 'type': 'json_object' } ativa o modo JSON.

Show child attributes

logprobs

boolean

Se deve retornar as probabilidades logarítmicas dos tokens de saída. Se verdadeiro, retorna as probabilidades logarítmicas de cada token de saída retornado no conteúdo da mensagem.

top_logprobs

integer

Um inteiro entre 0 e 20 que especifica o número de tokens mais prováveis a retornar em cada posição de token, cada um com uma probabilidade logarítmica associada. logprobs deve ser definido como verdadeiro se este parâmetro for utilizado.

Intervalo obrigatório: 0 <= x <= 20

user

string

Um identificador único representando seu usuário final, que pode ajudar a monitorar e detectar abusos. Também é utilizado para rastreamento de uso e análise.

stream_options

object

Opções para resposta em streaming. Defina isso apenas quando você definir stream: true.

Show child attributes

parallel_tool_calls

boolean

padrão:true

Se deve habilitar a chamada de funções em paralelo durante o uso da ferramenta.

reasoning_effort

enum<string> | null

Restrições de esforço no raciocínio para modelos de raciocínio. Menor esforço resulta em respostas mais rápidas e menos tokens de raciocínio. Valores suportados: 'nenhum', 'mínimo', 'baixo', 'médio', 'alto', 'muito alto' ou nulo.

Opções disponíveis:

none,

minimal,

low,

medium,

high,

xhigh

auto_routing

boolean

Quando verdadeiro, o gateway analisa a complexidade da solicitação e roteia automaticamente entre variantes quantizadas, MoE e densas da família de modelos solicitada.

Resposta

Resposta de conclusão de chat bem-sucedida. Retorna JSON para não streaming (stream=false) ou Eventos Enviados pelo Servidor para streaming (stream=true).

Representa uma resposta de conclusão de chat da API

string

obrigatório

Um identificador único para a conclusão do chat

object

any

obrigatório

O tipo de objeto, sempre 'chat.completion'

created

integer

obrigatório

O timestamp Unix (em segundos) de quando a conclusão do chat foi criada

Intervalo obrigatório: -9007199254740991 <= x <= 9007199254740991

model

string

obrigatório

O modelo usado para a conclusão do chat

choices

object[]

obrigatório

Uma lista de opções de conclusão de chat. Pode haver mais de uma se n for maior que 1.

Show child attributes

usage

object

obrigatório

Estatísticas de uso para a solicitação de conclusão

Show child attributes

system_fingerprint

string

Esta impressão digital representa a configuração de backend com a qual o modelo opera. Pode ser utilizada em conjunto com o parâmetro de solicitação seed para entender quando mudanças no backend foram feitas que podem impactar o determinismo.

Liste os tipos de aceleradores disponíveis

[Deprecado] Completações de chat por streaming para uso de SDK gerado

⌘I